Итерационное извлечение шаблонов описания событий по новостным кластерам (Iterative Pattern Extraction Using News Clusters)
نویسندگان
چکیده
В статье описывается метод итерационного формирования шаблонов описания событий по новостным кластерам. Небольшое количество размеченных примеров используется для построения базовых шаблонов, которые обогащаются за счет вариативности описания события в новостных сообщениях близкой тематики. Проведены эксперименты, в которых показана возможность формирования шаблонов для различных типов отношений.
منابع مشابه
Сеть естественных иерархий терминов новостных текстов по событиям «Евромайдана» (Network of Natural Hierarchies of Terms of News Messages on the "Euromaydan" Events)
Построение большой тематической онтологии – сложная и затратная проблема. Определенным этапом разработки общих онтологий является формирование словарных номенклатур, терминологических онтологий. Эффективный автоматический отбор отдельных терминов для таких конструкций на основании неразмеченных текстовых массивов – не решенная окончательно задача [5, 6]. Проблема автоматического установления св...
متن کاملNotes on Electronic Lexicography
Эти заметки являются продолжением темы, затронутой в статье В. Селегея Электронные словари и компьютерная лексикография. Речь пойдет о том, каким может быть электронный словарь, имеющий в качестве объекта описания близкородственные языки. Очевидно, такая постановка вопроса допускает несколько вариантов ответов, а единственным подтверждением правильности каждого из них мог бы стать словарь или с...
متن کاملМетоды автоматического построения формализованного представления содержания материалов электронных средств массовых коммуникаций для решения задачи мониторинга и оценки деятельности органов власти (Methods for Automatic Construction of a Formalized Representation of the Contents of Electronic Mass Communication Materials to Solve the Problem of Monitoring and Assessment of Authorities)
В данной статье рассматриваются возможности создания формализованного представления информационных публикаций в сети Интернет для получения показателей количественной оценки деятельности органов власти по материалам таких публикаций. Также рассматриваются методы построения формализованного описания информационных сообщений и методы адаптации автоматизированных средств семантической обработки со...
متن کاملИзвлечение информации о ситуациях отставок-назначений в новостных текстах. Опыт разметки коллекции. Результаты тестирования (Extracting Information on Appointments and Dismissals from News Texts. An Experience in Developing an Annotated Corpus. Testing Results)
متن کامل
Query expansion in information retrieval : What Can We learn from a Deep analysis of Queries?
Одна из основных задач информационного поиска—извлечение документов, релевантных информационной потребности пользователя, выраженной запросом. Зачастую пользовательские запросы не превосходят 3 слов, что усложняет задачу. Многочисленные исследования показали, что автоматическое расширение запроса в среднем повышает точность, несмотря на то, что для некоторых запросов результаты ухудшаются. В ст...
متن کامل